Apport du traitement des images à la numérisation des documents manuscrits anciens
نویسنده
چکیده
Image processing is often necessary for extracting the content of ancient documents. We present here techniques for restoring images and removing noise, extracting document structures (separating graphical elements and illustrations from text, extracting text lines) and, when possible, recognizing the textual or musical symbols which may be present in the image. These techniques, which are classified into three processing levels : preprocessing, segmentation, analysis and recognition, are described and some of them are illustrated on images of ‘ Lettres de Rémission’ of the 16 century. MOTS-CLÉS : prétraitements – segmentation – binarisation – extraction de lignes – structure graphique
منابع مشابه
Numérisation et codage des caractères de livres anciens
RÉSUMÉ. La numérisation des livres anciens n’a pas été abordée aussi bien que celle des ouvrages manuscrits anciens, du moins en ce qui concerne les caractères. Or, avant de faire de la reconnaissance de caractères, encore faut-il avoir un certaine connaissance de ceux-ci. Par ailleurs, restituer un ouvrage avec ses caractéristiques typographiques peut induire des recherches qui sinon seraient ...
متن کاملUne nouvelle approche pour indexer les documents manuscrits anciens Une nouvelle approche pour indexer les documents manuscrits anciens
Résumé : Dans cet article nous présentons une architecture pour la description et la recherche de documents manuscrits anciens. Nous utilisons une décomposition en Curvelets des images pour indexer les fragments linéaires de l’écriture. Appartenant à la famille des ondelettes, cette transformée nous permet d’avoir plusieurs niveaux de détails. Le schéma général consiste à analyser les orientati...
متن کاملUn modèle pour la représentation des connaissances temporelles dans les documents historiques
Résumé : Traiter et publier les données des sciences historiques dans le web sémantique constitue un défi intéressant où la représentation des aspects temporels joue un rôle clé. Nous proposons dans cet article un modèle de représentation des connaissances temporelles adapté au travail sur les documents historiques. Ce modèle est basé sur la notion de fluent que l'on représente dans des graphes...
متن کاملFusion des connaissances en analyse de documents - Exemples sur des documents d'archives
RÉSUMÉ. La reconnaissance de collections de documents structurés numérisés et notamment de documents d’archives est difficile non seulement par la complexité de l’organisation des documents, mais aussi par la dégradation des documents (tâches, déchirures, encre traversant le papier, courbures produites à la numérisation. . . ). Afin d’améliorer la qualité de la reconnaissance tout en gérant le ...
متن کاملUne nouvelle approche pour indexer les documents manuscrits anciens
HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- Document Numérique
دوره 7 شماره
صفحات -
تاریخ انتشار 2003